AGI(通用人工智能)对运营商通信网意味着什么?
专家谈:AI普适化对通信网带来哪些新需求?
“ChatGPT类应用的出现带来了对算网需求的变化。”联通数科首席AI科学家廉士国在接受《通信产业报》全媒体记者采访时表示,例如,用户在使用微软New Bing搜索时,搜索引擎后台除了运行传统搜索功能外还要额外同步运行ChatGPT类大模型;用户在使用带Copilot功能的微软Word时,需要能联接网络才可以与云端运行的ChatGPT类大模型实时互动。总之,越多的大模型应用、越多的用户量,就需要越多的算力、网络流量甚至网络带宽。
廉士国认为AGI具备两个关键特点。第一,单个模型具备“多才多艺”能力,就像每个人都可以看、听、说、互动那样多才多艺。第二,会通过自主学习实现持续成长,即像人类那样在与周围人、物、环境等交互过程中获得反馈并自主地持续学习进步。
“目前,业界大火的ChatGPT初步具备了第一个关键特点。”廉士国表示,主要通过提升大模型的参数规模来实现百科问答、创作、编程等多种能力,虽然仅限制在自然语言能够表述的范围内,但ChatGPT还不具备自主持续地在线学习能力,还不知道何时启动学习、哪些该学哪些不该学等,仍然需要人工介入。
AGI的研发和应用分为离线训练开发阶段、在线推理应用阶段、在线自主持续学习阶段,对算网的需求有所不同。
其中,在离线训练开发阶段,大模型的训练过程,一般在以大算力为基础的智能算力中心内进行,需要对大量数据做计算处理。类似人脑学习过程中数据在大脑内部做流转,在智能算力中心内部,大量数据要在GPU卡之间和服务器之间快速交换,这需要高带宽数据传输通道来支撑,目前一般采用NVLink和InfiniBand网络。
在线推理应用阶段,以ChatGPT为基础的智能应用,目前以SaaS方式提供服务。作为人类的智能助手,新应用将不断出现、用户量持续增加、使用频次相对较高,这在增加了网络流量的同时,也对服务提供方的算力规模和出口带宽提出了挑战。
在线自主持续学习阶段,AGI将会在实时应用中搜集周围人、物和环境反馈的数据信息,并在线训练和更新模型。这需要以实时数据传输和实时训练计算为基础,即需要算网融合体系的支撑,除了对算力规模和网络带宽等要求外,还需要云、边、端部署方式的协同。
在谈到AGI与算网的关系时,廉士国表示,以人类为例,其智能可划分成局部智能、个人智能、群体智能等。
从长远来看,人工智能的布局方式可能是端侧,主要部署局部智能,具备某方面垂直智能能力,例如工业品质检,个性化强、使用频次高;边缘,主要部署个人智能,具备通用智能能力,例如ChatGPT这样类人的多才多艺,会自主迭代成长;云上,主要部署群体智能,具备超级智能能力,例如集合众人之长的超级能力,会集合多个“个人”的共性,训练更新频次相对较低。这些不同层级的智能有机融合进算网体系的相应环节中,形成算网智能体,就犹如重塑人、人类社会那样。
廉士国认为以下几点未来趋势值得关注。
首先,考虑到目前ChatGPT类AIGC/大模型的智能能力还有待提升(如学习更多专业知识)和扩展(如具备视觉、语音、动作等更多模态能力),AGI大模型的参数规模还将呈现持续增大趋势。随着AI模型越来越大,需要用来训练的集群规模也越来越大,单个数据中心容纳的集群规模可能不够用,这就需要跨数据中心(IDC)的高速数据传输通道,来实现跨IDC训练集群融合。
其次,可以预见以大模型为基础的应用会更加普及,这给集中化部署的大模型MaaS带来挑战,例如服务并发能力、出口带宽问题等。为减轻支撑大量用户并发服务的压力和提升性价比,将推理算力分散化做并行分布式部署和协同,并尽量向边缘侧下沉是未来的趋势。
最后,以人类为例,在实际生活和工作中尤其实体经济场景中,并非每个岗位都需要“多才多艺”的员工,从人效比的角度看更需要适合相应岗位的员工。从投入产出比的角度看实际应用落地,业界将会持续打造具备各种“职业技能”的AI,把AGI模型做垂直化和小型化,可在边缘甚至终端侧部署。
推荐阅读